专利摘要:
提供一種基於具有嵌入式浮水印的一再現性音訊信號提供方向資訊之裝置。該裝置係包含一信號處理器,其係適用以處理由位在不同的空間位置之至少兩個音訊接收器所記錄的至少兩個所接收的附浮水印音訊信號。該信號處理器係適用以處理所接收的附浮水印音訊信號以獲得針對各個所接收的附浮水印音訊信號之一接收器特定資訊。該接收器特定資訊係取決於嵌入在該所接收的附浮水印音訊信號內的該嵌入式浮水印。此外,該裝置係包含一方向資訊提供器,其係基於針對各個所接收的附浮水印音訊信號之該接收器特定資訊而提供方向資訊。
公开号:TW201312550A
申请号:TW101131841
申请日:2012-08-31
公开日:2013-03-16
发明作者:Oliver Thiergart;Galdo Giovanni Del;Florian Kolbeck;Alexandra Craciun;Stefan Kraegeloh;Juliane Borsum;Tobias Bliem
申请人:Fraunhofer Ges Forschung;Univ Friedrich Alexander Er;
IPC主号:G01S3-00
专利说明:
使用附浮水印音訊信號與麥克風陣列之抵達方向評估技術
本發明係有關於音源諸如揚聲器之抵達方向的決定及空間位置估計的裝置及方法。
取回聲音場景的幾何資訊,諸如定位估計及輸入信號之抵達方向的估計的重要性漸增,原因在於此項資訊在多項應用為有價值,諸如回聲控制、場景分析、束形成、及分散式聲音感測器的信號處理。
舉例言之,若單一揚聲器再現一音訊項目且一麥克風陣列係可用於記錄,則有分析所記錄的音訊信號,其中未嵌置浮水印信號之方法。若不存在有其它音源,例如講話者或其它干擾器,則例如透過方向音訊編碼,可能估計抵達方向。參考文獻Jukka Ahonen、Giovanni Del Galdo、Markus Kallinger、Fabian Kuch、Ville Pulkki、及Richard Schultz-Amling,「使用方向音訊編碼為空間音訊的分析與再現作平面麥克風陣列處理」,於音訊工程學會會議124,5,2008。一旦另一個來源係同時發出聲音,其抵達方向為不合所需,則正確入射角的決定受妨礙。若目前信號係源自於不同空間位置,則將獲得抵達方向的兩個不同估值。於此種情況下,需要有關偏好的聲音信號之額外資訊。
於具有多於一個揚聲器的一種再現系統之情況下,若再現信號為不同,則可能使用先前解說的辦法估計抵達方向。但若相似的音訊項目係經回放,亦即在立體聲設備回放,則出現眾所周知的現象,亦即假影源。如此表示聲音被覺察彷彿係由位在多個揚的現象,亦即假影源。如此表示聲音被覺察彷彿係由位在多個揚聲器間的一個虛擬來源所播放。於此種情況下,無法估計入射角。
針對涉及再現系統計算的特定應用,存在有其它眾所周知之方法,例如,播放MLS信號或掃掠信號,其係用以決定回放聲音的入射角。參考Giovanni Del Galdo、Matthias Lang、Jose Angel Pineda Pardo、Andreas Silzle、及Oliver Thiergart,「3D揚聲器設備之聲學測量系統」,於音訊工程學會會議:空間音訊:感測空間的聲音,10 2010。但此等信號為可聽聞且經常為擾人。此外,再現系統可使用前須進行校準。因此,附浮水印音訊信號的使用為較佳,密記校準可在系統操作期間進行。
決定感測器之方向或位置的一項常用技術係採用射頻信號及各種感測器。基於此項技術之方法提供良好估值,但不適用於射頻信號被禁止使用或難以使用的領域。又復,於此種情況下,須安裝射頻感測器。
也利用浮水印信號的另一個方法係呈現在Ryuki Tachibana、Shuichi Shimiza、Seiji Kobayashi、及Taiga Nakamura,「使用二維虛擬隨機陣列之音訊附浮水印方法」,信號處理,第82期,第1455-1469頁,2002年10月。此處,藉使用只有一個麥克風及測量若干所發出的附浮水印音訊信號之抵達時間延遲來估計記錄位置。於此種情況下,並無任何可用方向資訊,系統限於使用最少數目的揚聲器。
如前文已述,先前技術具有若干問題。依據若干先前技術方法,可定位非相對應於該期望揚聲器的一虛幻音源。其它先前技術方法具有下述問題,該等方法將定位室內的其它音源或需要特殊量度信號,而該等信號在揚聲器實際使用的直播情況下係無法再現者。本發明之目的係提供決定傳輸信號之抵達方向的改良構思。依據本發明之另一個構面,提供空間位置估計之改良構思。本發明之目的係藉如申請專利範圍第1項之提供方向資訊之裝置、如申請專利範圍第14項之提供方向資訊之方法、如申請專利範圍第15項之提供方向資訊之電腦程式、如申請專利範圍第16項之空間位置估計之裝置、如申請專利範圍第17項之空間位置估計之方法、及如申請專利範圍第18項之空間位置估計之電腦程式加以解決。
提出一種基於具有一嵌入式浮水印的一再現性音訊信號提供方向資訊之裝置。該裝置係包含一信號處理器,其係適用以處理由在不同空間位置的至少二音訊接收器所記錄的至少二所接收的附浮水印音訊信號。該等音訊接收器係適用以記錄該再現性音訊信號的聲波而獲得該所接收的附浮水印音訊信號。各個所接收的附浮水印音訊信號包含該嵌入式浮水印。該信號處理器係適用以處理該所接收的附浮水印音訊信號而獲得針對各個所接收的附浮水印音訊信號之一接收器特定資訊。此外,該接收器特定資訊係取決於嵌入在該等所接收的附浮水印音訊信號內之該等嵌入式浮水印。此外,該裝置係包含一方向資訊提供器,其係基於針對各個所接收的附浮水印音訊信號之該接收器特定資訊而提供方向資訊。
一個實施例描述一種決定方向資訊,例如由一揚聲器所再現的一音訊信號抵達方向(DoA)之方法。該信號係作為在時頻域產生的不可聽聞浮水印信號之載波。係藉包含至少二麥克風的一麥克風陣列記錄。隨後,記錄進一步處理目標針對檢測嵌入式浮水印信號。一旦復原浮水印,即可用來估計音源相對於陣列定向的方向。取決於應用,此一構思可進一步調整且應用至包含任意數目揚聲器的設備。
於一個實施例中,該信號處理器包含一分析模組,該分析模組用以將該所接收的附浮水印音訊信號從一時域轉換成一時頻域以獲得包含多個子帶信號之一時頻域傳輸信號。於一個實施例中,該信號處理器係適用以決定一複合數作為該接收器特定資訊。舉例言之,該複合數可指示由該等音訊接收器中之一者所記錄的一附浮水印音訊信號之一複合係數值或一平均複合係數。於又一個實施例中,該信號處理器可適用以決定相位資訊作為該接收器特定資訊。舉例言之,該相位資訊可為由該等音訊接收器中之一者所記錄的一附浮水印音訊信號之一相位值或平均相位值。於又一個實施例中,該信號處理器可適用以由該等音訊接收器中之一者所記錄的一附浮水印音訊信號之一幅值或一平均幅值作為接收器特定資訊。
依據一實施例,該信號處理器係適用以基於一所決定的平均複合係數而決定一平均相位值作為該相位資訊。該信號處理器可適用以藉決定包含一子帶信號的已處理之複合係數的一平均週期性區塊而產生該平均複合係數。
於一個實施例中,該信號處理器係適用以藉組合該等子帶信號之已處理複合係數中之至少二者而決定平均複合係數,其中該等已處理複合係數係具有相等相位值或差異不超過0.5弧度度量的相位值。又復,該信號處理器可適用以藉改變該等複合係數中之至少一者的該相位值達一預定數,例如當使用反足二進制相移鍵控(BPSK)作為調變方案時,或取決於所使用的調變方案及已知嵌入式序列藉適當相位值而產生該已處理的複合係數依據一實施例,該信號處理器係適用以決定一同步命中位置,其指示編碼一浮水印簽章之一第一位元的一複合係數之一位置。
該方向資訊提供器係適用以採用一複合數來決定與提供方向資訊。此外,該方向資訊提供器係適用以提供一抵達向量方向作為方向資訊。
此外,提供一種提供方向資訊之方法。該方法包含下列步驟:接收附浮水印音訊信號,各個所接收的附浮水印音訊信號係包含一嵌入式浮水印,處理由在不同空間位置的至少二音訊接收器所記錄的至少二所接收的附浮水印音訊信號以決定針對各個所接收的附浮水印音訊信號之一接收器特定資訊,其中該接收器特定資訊係取決於嵌入在該等所接收的附浮水印音訊信號內之該等嵌入式浮水印,及基於針對各個所接收的附浮水印音訊信號之該接收器特定資訊而提供方向資訊。
此外,提供一種空間位置估計裝置。該裝置包含依據一實施例一種提供方向資訊之裝置,及一用以估計該提供方向資訊之裝置的一位置之位置估計器,其中該位置估計器係適用以基於由該提供方向資訊之裝置所提供的方向資訊而估計該空間位置估計裝置的位置。
空間位置估計的構思係植基於決定麥克風陣列的空間記錄位置,但限制條件為有足夠數目的揚聲器可資利用及其空間位置為已知。舉例言之,三具揚聲器可採用來決定在一共用平面中一麥克風陣列的位置。值得一提者為所提示的構思並非限於方位的決定。此外,取決於所使用的方向估計方法可估計仰角。
此外,提供一種空間位置估計之方法。該方法係包含藉採用至少兩個音訊接收器之一陣列,接收附浮水印音訊信號,各個所接收的附浮水印音訊信號係包含一嵌入式浮水印;處理由在不同空間位置的至少二音訊接收器所記錄的至少二所接收的附浮水印音訊信號以決定針對各個所接收的附浮水印音訊信號之一接收器特定資訊,其中該接收器特定資訊係取決於嵌入在該等所接收的附浮水印音訊信號內之該等嵌入式浮水印;基於針對各個所接收的附浮水印音訊信號之該接收器特定資訊而提供方向資訊;及估計該至少兩個音訊接收器之陣列之一位置,其中該位置係基於該方向資訊決定。
可能的應用實例例如為玩具,其可回應於某個音訊信號的回放,例如當播放某些電視劇時,動作娃娃可將轉頭朝向電視。
又一個應用實例為再現系統校準:本發明可用以當視訊會議正在進行中或音訊項目正在播放中,自動地校準一再現系統,例如視訊會議或家庭劇院系統的設備。於此種情況下,無需事先校準。
此外,音訊信號之聲道可經操控來取決於所提供的方向資訊轉高或轉低某些揚聲器在某些位置的音量。此外,使用者可藉系統接到指示,取決於所提供的方向資訊而如何最佳地定位聲音系統的揚聲器。
又一個應用實例為前述空間位置估計裝置。 圖式簡單說明
將參考附圖解說較佳實施例,附圖中:圖1顯示依據一實施例一種提供方向資訊之裝置的示意方塊圖,圖2例示說明依據一實施例一種提供方向資訊之裝置於一應用場景,圖3A-3C例示說明展頻及展時的一浮水印,圖4顯示一種產生一浮水印信號之調變器,圖5闡釋一種產生浮水印信號的裝置,圖6A-6B例示說明依據一實施例一種提供方向資訊之裝置於又一應用場景,圖7例示說明依據一實施例一種提供方向資訊之裝置的組件,圖8A提供依據一實施例當採用過取樣時,在時頻平面上係數之位置的綜覽實例,圖8B例示說明包含嵌入式浮水印之一時頻域子帶信號,圖9A-9D闡釋依據一實施例浮水印簽章、同步區塊、週期性區塊、及平均同步區塊,圖10例示說明依據一實施例的多工浮水印,圖11A-11D顯示一種同步支援單元的替代體現之示意圖,圖11C顯示一種同步簽章相關器之方塊示意圖,圖12A顯示找出一浮水印的時間性對齊問題之圖解代表圖,圖12B顯示識別訊息起始問題之圖解代表圖,圖12C顯示用於同步化資料之圖解代表圖,圖12D顯示識別一同步命中構思之圖解代表圖,圖13A顯示時間性解除擴展之一實例的圖解代表圖,圖13B顯示在位元與展頻序列間之逐一元件乘法之一實例的圖解代表圖,圖13C顯示於時間性平均後,同步簽章相關器之一輸出之圖解代表圖,圖13D顯示具有以同步簽章的自我校正函式濾波的同步簽章相關器之一輸出之圖解代表圖,圖14例示說明包含差異解碼位元之週期性區塊與包含複合係數之週期性區塊間之關係,圖15A闡釋一音訊信號部分的及一浮水印信號部分的複合向量,圖15B闡釋音訊信號部分的一平均複合向量及浮水印信號部分的一平均複合向量,圖15C例示說明於不同階段的樣本積分,圖15D例示說明不同子帶的兩個積分複合係數,圖16例示說明沿笛卡爾座標系的軸配置之六個麥克風,圖17顯示依據一實施例於xy平面之方位角決定,圖18A-D闡釋依據一實施例決定的抵達向量之方向,圖19例示說明依據一實施例的位置估計,圖20A-B闡釋位置估計挑戰及解決方案,圖21例示說明依據一實施例一種位置估計之裝置,及圖22例示說明依據一實施例一種空間位置估計之裝置。 1.依據圖1提供方向資訊之裝置
圖1例示說明依據一實施例一種基於具有嵌置浮水印的一再現性音訊信號提供方向資訊之裝置100。該裝置100包含一信號處理器110。該信號處理器110係適用以處理由位在不同的空間位置之至少兩個音訊接收器所記錄的至少兩個所接收附浮水印音訊信號rx1、rx2。該至少兩個音訊接收器係適用以記錄該再現性音訊信號之聲波而獲得該等至少兩個所接收附浮水印音訊信號。各個所接收附浮水印音訊信號rx1、rx2包含該嵌置浮水印。此外,該信號處理器110係適用以處理該等所接收附浮水印音訊信號而獲得針對各個所接收音訊信號rx1、rx2之一接收器特定資訊rsi1、rsi2。接收器特定資訊rsi1、rsi2係取決於嵌置於該等所接收附浮水印音訊信號rx1、rx2中之浮水印。此外,提供方向資訊之裝置100包含一方向資訊提供器120。該方向資訊提供器係適用以基於針對各個所接收音訊信號rx1、rx2的該接收器特定資訊rsi1、rsi2而提供方向資訊。 2.依據圖式之應用場景
圖2例示說明一場景,其中提供方向資訊之裝置100從二音訊接收器221、222接收兩個附浮水印音訊信號rx1、rx2。於圖2中,包含一浮水印的音訊信號awm係藉一麥克風210再現為聲波sw。該聲波sw係由至少兩個音訊接收器221、222例如二麥克風記錄而獲得至少兩個所接收音訊信號rx1、rx2。各個所接收音訊信號rx1、rx2包含該嵌置浮水印。
所接收附浮水印音訊信號rx1、rx2然後輸入該提供方向資訊之裝置100的信號處理器110。該信號處理器110係適用以處理該等所接收附浮水印音訊信號rx1、rx2而獲得針對各個所接收音訊信號rx1、rx2之一接收器特定資訊rsi1、rsi2。取決於包含於該所接收附浮水印音訊信號中的浮水印,該接收器特定資訊可為相位資訊。此外,該相位資訊係取決於該等音訊接收器的空間位置。舉例言之,比較抵達一第二音訊接收器222,包含該浮水印之一再現性音訊信號的聲波可略早地抵達第一音訊接收器221。因此比較於第二接收信號rx2,第一接收信號rx1中的浮水印係略微更早接收。一般而言,兩個接收信號rx1、rx2皆相當類似。但因二信號在時間上相對於彼此略為偏移,故將二接收信號rx1、rx2從時域變換至時頻域,通常導致有關相同頻率子帶及時間指數為不同的二頻域信號相位值。
信號處理器110饋送接收器特定資訊rsi1、rsi2至方向資訊提供器120。該方向資訊提供器120係適用於針對各個接收音訊信號rx1、rx2,基於接收器特定資訊rsi1、rsi2而提供方向資訊di。舉例言之,方向資訊di可基於相位資訊而提供。第一接收信號rx1的第一相位值及第二接收信號rx2的第二相位值例如藉計算相位差處理。基於計算得的相位差,方向資訊提供器120可決定方向資訊di。舉例言之,可決定再現性音訊信號的聲波可能源自的可能方向。 3.浮水印產生:
於後文中,為了提供有關浮水印的背景資訊,參考圖3A至圖5闡釋的圖式解說編碼器中浮水印的產生。於時頻域產生浮水印的浮水印技術係呈現於歐洲專利申請案,申請案號10154953.3、10154960.8、10154964.0、10154948.3、10154956.6及10154951.7,各案係爰引於此並融入本說明書的揭示。
基本上,浮水印是個隱藏在另一個信號例如音訊信號中的編碼位元簽章。該位元簽章可採用多個頻帶(子帶)編碼。
圖3A至圖3C例示說明欲編碼於不同頻帶的浮水印簽章之二進制值。雖然浮水印可用來傳輸資訊,但於後文中,將聚焦在使用浮水印傳輸浮水印簽章的構面。
一般而言,浮水印簽章可為任意位元序列,例如位元序列:[1,1,-1,1,-1,-1]。圖3A例示說明相對應的浮水印簽章310。
浮水印位元序列係使用展開序列而展頻。舉例言之,為了將浮水印簽章展開至m個頻帶,可採用包含m個值的展頻向量。於最簡單的情況下,展頻向量只包含1,例如可採用[1,1,1],結果導致針對個別頻帶拷貝浮水印簽章。於更為複雜的實施例中,展頻向量也可包含-1,例如[1,-1,1],結果導致針對個別-1位元,浮水印簽章在拷貝為了在個別頻帶中編碼前係經反相。圖3B例示說明前述浮水印簽章,其係藉採用擴展向量[1,-1,1,-1]來獲得展頻浮水印320。
展頻浮水印也可藉採用擴展向量來於時域擴展。舉例言之,藉採用向量[1,-1]用於時域擴展,展頻浮水印簽章各自可首先以其原先形式編碼,及然後反向用以編碼。圖3C例示說明展頻及展時浮水印簽章330,其中展時已經藉採用擴展向量[1,-1]進行。
在頻率及可能在時間擴展後,浮水印簽章可重複編碼。
不同位元序列可差異編碼。差分編碼器可執行位元的差異編碼。由於移動或本地振盪器不匹配,此一步驟獲得系統對相移的額外穩健。若b(i;j)為第i頻帶及第j時區的位元,則輸出位元bdiff(i;j)b diff(i,j)=b diff(i,j-1).b(i,j).在串流起點,亦即針對j=0,bdiff(i;j-1)係設定為1。
調變器307進行實際調變,亦即取決於在其輸入給定的二進制資訊,產生浮水印信號波形。相對應調變器的進一步細節示意圖係顯示於圖4。Nf並聯輸入401至40Nf含有針對不同子帶的位元串流。各個子帶串流的各個位元係藉位元塑形區塊(411至41Nf)處理。位元塑形區塊的輸出為時域中的波形。基於輸入位元bdiff(i;j),第j時區及第i子帶所產生的波形,標示以si;j(t)係計算如下:s i,j(t)=b diff(i,j)γ(i,j).g i (t-j.T b),於該處γ(i;j)為由心理聲學處理單元提供的加權因數,Tb為位元時間區間,及gi(t)為第i個子帶的位元形成函式。位元形成函式係得自以餘弦調頻的基帶函式(t) 於該處fi為第i個子帶之中心頻率,及上標T表示發射器。對各個子帶的基帶函式可不同。若選用為相同,則可能在解碼器有更有效的體現。
前述嵌入式方法述及反足BPSK調變方案,亦即,於該處編碼資訊位置單純改變位元形成函式的符號。另外,可分組二或更多個位元,可使用更高階調變型(諸如QAM或M-PSK)。例如如常用者,仍可施用差分編碼於差異編碼QPSK。
各位元的位元塑形係在由心理聲學處理模組102所控制之一迭代過程重複。可能需要迭代重複來微調權值γ(i,j)來分派儘可能多的能量給浮水印同時維持其可聽聞。
在第i個位元塑形濾波器41i的輸出之完整波形為
位元形成基帶函式(t)正常為非零歷經遠大於Tb的時間區間,但主要能量係集中在位元區間內部。一個實例可參考圖9A,於該處為兩相鄰位元作圖相同位元形成基帶函式。於圖9A中,具有Tb=40毫秒。Tb的選擇以及函式形狀顯著影響系統。實際上,較長的符碼提供較窄的頻率響應。此點在混響環境為特別有利。事實上,於此種情況下,附浮水印的信號透過數個傳播途徑到達麥克風,各途徑具有不同傳播時間特徵。所得聲道具有強力頻率選擇性。以時域解譯,較長的符碼為有利,原因在於回聲具有與位元區間降伏建設性干擾可相媲美的延遲,表示其增加所接收的信號能。無庸殆言,較長的符碼也帶來數個缺點;較大型重疊可能導致符碼間干擾(ISI),確定更難以隱藏在音訊信號內,使得心理聲學處理模組將許可比較短的符碼更少的能量。
浮水印信號係藉加總位元塑形濾波器的全部輸出獲得
圖5顯示浮水印插入器500之方塊示意圖。在編碼器端,浮水印信號501b係在處理方塊501(又稱浮水印產生器)從二進制資料501a且基於與心理聲學處理模組502交換的資訊504、505產生。從方塊502提供的資訊典型地保證該浮水印為不可聽聞。由浮水印產生器501產生的浮水印係加至該音訊信號506。
如前文已述,需要加權因數γ(i,j)以為各子帶計算波形si;j(t)。加權因數γ(i,j)的目的係為了隱藏浮水印不可聽聞於所得附浮水印信號507。加權因數γ(i,j)係由包含三部分的心理聲學處理模組502提供。第一部分為分析模組,其將時域音訊信號變換成時/頻域。此一分析模組可在不同時/頻解析度進行平行分析。在分析模組後,時/頻資料係轉移至心理聲學模型(PAM),其中浮水印信號的遮蔽臨界值係依據心理聲學考量計算。遮蔽臨界值指示針對各子帶及各時間區塊,可隱藏在音訊信號的能量。心理聲學處理模組502的最末方塊為幅值計算模組。此一模組決定用在產生浮水印信號的幅值增益,使得滿足遮蔽臨界值,亦即嵌置能係小於或等於由遮蔽臨界值定義的能量。
於圖6A中,單一揚聲器610係用在附浮水印音訊信號awm的再現。至於第一步驟,浮水印信號wm係藉一組合單元605組合音訊信號a而獲得一附浮水印音訊信號awm。浮水印信號wm已如參考圖3A-4所述產生。附浮水印信號awm可如參考圖5所述藉浮水印產生器產生。例如浮水印信號wm可已經加至音訊信號a。
從藉組合單元605進行組合所得的附浮水印音訊信號awm然後藉揚聲器610再現且藉感測器621、622、...、62N記錄,例如一麥克風陣列的N個麥克風而獲得N個信號s1、s2、...、sN。記錄的信號s1、s2、...、sN不只包含附浮水印揚聲器信號,同時也包含干擾雜訊,例如室內有人講話及混響引發的效應。然後記錄的信號s1、s2、...、sN輸入依據一實施例提供方向資訊之裝置100。裝置100決定輸出方向資訊,例如可決定且輸出抵達方向(DoA)。
但於其它組態中,多個揚聲器611、612、...、61N可適用以輸出多個附浮水印信號awm1、awm2、...、awmM。此點係例示說明於圖6B。不同浮水印信號wm1、wm2、...、wmM係加至音訊信號a1、a2、...、aM,例如用於家庭劇院再現的音訊項目之汰選聲道。本場景的處理係類似只有一個揚聲器再現一附浮水印信號的情況。
圖7例示說明依據一實施例提供方向資訊之裝置100。例示說明多個所接收的附浮水印音訊信號s1、s2、...、sN,例如可藉圖6闡釋的麥克風621、622、...、62N記錄的信號。所接收的附浮水印信號s1、s2、...、sN,係表示於時域,饋入分析模組711、712、...71N來變換成時頻域且用於標準化。 4.1分析模組711、712、...71N
為了解說分析模組711、712、...71N,考慮所接收的附浮水印音訊信號中之一者。藉採用分析濾波器排組,分析模組中之一者將附浮水印音訊信號從時域變換成時頻域。濾波器排組的輸入為個別附浮水印音訊信號。其輸出為在時間瞬間j針對第i個分支或子帶的複合係數(j)。此等值含有有關在中心頻率fi及時間j.Tb的信號之幅值及相位的資訊。
濾波器排組包含Nf分支,各個頻譜子帶i各有一個分支。各個分支分裂成同相位成分的一上子分支,及子帶i的正交成分的下子分支。雖然在浮水印產生器的調變及因而附浮水印音訊信號純粹為實數值,但在接收器需要信號的複合值分析,原因在於由聲道及由同步未對齊所導入的調變型的旋轉在接收器為未知。後文中,發明人考慮濾波器排組的第i個分支。藉組合同相位分支及正交分支,發明人可定義複合值基帶信號(t)為 於該處*指示迴旋及(t)為子帶i的接收器低通濾波器之脈衝響應。通常(t)係等於調變器中基帶i的基帶位元形成函式(t)以滿足匹配濾波條件,但其它脈衝響應亦屬可能。
為了獲得具有速率l=Tb的係數(i),須取樣連續輸出(t)。若接收器為已知位元的正確時間,則以速率l=Tb取樣即足。但因位元同步尚未知,故以速率Nos/Tb進行取樣,於該處Nos為濾波器排組過取樣因數。藉將Nos選擇為夠大(例如Nos=4),發明人可確定至少一個取樣週期係夠接近理想位元同步。對最佳過取樣層的決定係在同步化過程做出,故全部過取樣資料皆係維持直至該時間。
於第i個分支的輸出,發明人具有係數(j,k),於該處j指示位元數目或時間瞬間,及k指示在此單一位元內部的過取樣位置,於該處k=1、2、...、Nos
圖8A顯示在時頻平面上係數位置的綜覽實例。於圖8A中,過取樣因數為Nos=2。矩形的高度及寬度個別地指示由相對應於係數(j,k)表示的信號部分之帶寬及時間區間。
若子帶頻率fi係選用為某個區間△f的倍數,則分析濾波器排組可使用快速傅利葉變換(FFT)有效地體現。
針對各頻帶所得複合係數的標準化可如下述進行:不喪失普及性且為了簡化說明,於後文中發明人假設位元同步為已知及Nos=1。在標準化之前,具有複合係數(j)。由於並無聲道狀態資訊可資利用(亦即傳播聲道為未知),使用相等增益組合(EGC)方案。由於時間及頻率分散性聲道,發送位元的能量bi(j)不僅環繞中心頻率fi及時間瞬間j,同時也在相鄰頻率及時間瞬間。因此,為了更精準加權,於頻率fi±n△f的額外係數經求出且用於係數(j)的標準化。若n=1例如, n>1的標準化為上式的直捷擴延。標準化係對各個子帶i及各個時間瞬間j進行。
此外,可只對一個麥克風運算標準化因數及然後施加至全部麥克風,抵達方向估計可只使用接收器特定資訊的幅值。
圖8B例示說明一子帶信號,其中二浮水印信號部分WM1及WM2為時間多工。子帶信號包含得自第一揚聲器的第一音訊源LS1的聲音部分,及得自第二揚聲器的第二音訊源LS2的聲音部分。此外,子帶信號也包含得自第一揚聲器的浮水印信號部分WM1,或得自第二揚聲器的浮水印信號部分WM2。 4.2選擇模組720:
回頭參考圖7,變換成時頻域及標準化後,時頻域信號S1、S2、...、SN係饋入選擇模組720。選擇模組720決定可用信號S1、S2、...、SN中之哪一者須用來執行隨後的同步化。針對選擇模組720存在有若干可能性來在信號間作選擇。於一個實施例中,選擇模組720係適用以隨機地選擇輸入信號S1、S2、...、SN中之一者。。舉例言之,選擇模組可選擇時頻域信號S1。於另一個實施例中,選擇模組720係適用以平均信號S1、S2、...、SN及使用平均信號。 4.3微分解碼器730:
然後選擇模組720將所得信號饋進微分解碼器730。在微分解碼器730的輸入,具有幅值標準化的複合係數(j),其含有有關在頻率fi及時間瞬間j的信號成分相位之資訊。因位元係在發射器差異地編碼,此處須執行反相操作。藉首先計算兩個接續係數的相位及然後取實數部分,獲得軟位元(j):
此點須針對各個子帶分開進行,原因在於聲道通常在各個子帶導入不同相位旋轉。
微分解碼器730微分地解碼輸入信號來藉首先計算兩個接續係數相位差及然後取相位的實數部分而獲得所謂軟位元。須注意所得軟位元可取任何實數值,尚未對位元作任何硬決策。因軟位元可呈任何實數值,故非必然為-1或1,反而可具有與-1或1不同的實數值,諸如0.92、-0.88、0.97等。
此外,當輸入微分解碼器時,子帶信號可被過取樣。微分解碼器當微分解碼該子帶信號時考慮過取樣。舉例言之,考慮下述情況,子帶信號已經藉過取樣因數q而過取樣。舉例言之,針對第i個子帶有係數(j,q),於該處j指示位元數或時間瞬間,及q指示在此單一位元內部的過取樣位置,於該處q=1、2、...、Nos。然後,以過取樣因數q,藉施加下式計算q軟位元:
然後微分解碼器730將軟位元串流饋入積分模組740,在時間上跨數個同步簽章而積分軟位元串流以進一步改良同步準確度。 4.4積分模組740:
現在將以進一步細節解說積分模組740。當採用藉單一揚聲器產生的只有一個浮水印簽章wm1時,浮水印簽章wm1重複發射使得當浮水印簽章wm1的最末位元被發射時,其次接著浮水印簽章wm1的第一位元等。圖9A闡釋相對應序列。若唯一採用的(例如展時)浮水印簽章wm1包含N個位元,則在N位元後重複位元序列,則唯一浮水印簽章形成長度N位元的同步區塊sync。
但如前文已經說明,系統可包含多於一個揚聲器。為了獲得各個揚聲器抵達方向之估值,須決定所記錄的信號之哪個部分係由某個揚聲器發出。因此浮水印信號須經多工化。可能有不同方法,其為通訊上眾所周知,亦即劃碼多向接取(CDMA)、分頻多向接取(FDMA)及分時多向接取(TDMA)。於一個實施例中,採用分時多向接取。為了決定所記錄信號的哪些部分係屬某個揚聲器,不同的浮水印簽章係嵌入不同揚聲器信號內。圖10例示說明使用二揚聲器及包含六序列的同步簽章之時間多工化。
如此,不同揚聲器可發出不同浮水印,例如二浮水印wm1、wm2可經時間多工化。假設兩個(例如展時)浮水印的位元數為N。首先,發出第一浮水印簽章wm1。其後發出第二浮水印簽章。然後,再度發出第一浮水印簽章wm1,接著為第二浮水印簽章wm2等。然後,同步區塊sync包含浮水印wm1、wm2且具2.N位元。圖9B闡釋有兩個多工化浮水印簽章的場景。
各個同步區塊重複地發射。假設同步序列具有Nsync位元,則位元1係等於位元Nsync+1,及等於位元2.Nsync+1等。位元2係等於位元Nsync+2,及等於位元2.Nsync+2等。針對關注子帶i的所得式為:,對j=0,...,Nsync-1,當藉分析模組711、712、...71N進行過取樣時,例如使用過取樣因數Nos,則Nos微分解碼位元值候選者(j,k)已針對一關注子帶i的各個單一位元(j)產生。結果獲得下式: 對j=0,...,Nsync-1,其中q=1、2、...Nos指示在關注位元內部的過取樣位置。
積分模組係適用以積分該等軟位元,使得多個不同的同步區塊的軟位元相加而改良浮水印解碼處理的穩健度。
首先,包含微分解碼位元的位元串流被劃分成具有Nsync位元的接續週期性區塊p1、p2、p3。此時,積分模組740不知同步區塊的起點在何處。但此點並非必要,原因在於微分解碼位元串流的週期性並非仰賴同步區塊的起點,反而係取決於同步區塊的長度。對此同步區塊的第一位元可位在週期性區塊內部某處。圖9C例示說明此一場景。
為了形成一平均同步簽章區塊p0,不同週期性區塊的相對應位元相加。舉例言之,第一、第二及第三浮水印週期的第一位元相加,第一、第二及第三浮水印週期的第二位元相加,直至第一、第二及第三浮水印週期的Nsync位元相加。各個所得位元可除以求平均的週期性區塊數目。如此導致下式:
本式中,i為關注子帶,K表示求平均的同步區塊數目,k表示考慮的實際同步區塊,而j為在週期性區塊內部考慮的位元位置。平均同步區塊具有Nsync位元:
第一浮水印簽章的第一位元係位在平均同步區塊p0的某處。圖9D例示說明顯示平均同步區塊p0的場景。
若在分析模組711、712、...71N中的分析已經以過取樣因數Nos進行,則也考慮過取樣。於此種情況下,針對週期性區塊的各個位元為全部Nos微分解碼位元值候選者(i,q)產生平均值。如此導致下式:,其中j=0,1,2,...,Nsync-1其中q=1,2,...,Nos指示在考慮位元內部的過取樣位置。
藉積分模組740進行積分,產生平均軟位元,或於過取樣之情況下,針對平均同步區塊p0之該等位元的各者產生多個Nos軟位元值候選者。
於額外實施例中,於該處語音信號用作為浮水印載體,積分特別重要,原因在於其常含有無浮水印信號的間隙。藉此當進行時間積分時,存在於軟位元串流的誤差通常將減少。 4.5同步模組750:
在位元序列已經就時間積分後,積分模組740將已積分軟位元串流饋進同步模組750,執行穩健同步化。詳言之,同步模組750執行與嵌入式同步簽章的相關性。由此獲得同步命中位置。現在將以進一步細節解說於同步模組750中的同步化。
同步模組750的任務係找出平均同步區塊內部一或多個浮水印的時間性對齊。
同步化解碼器與編碼資料的問題有雙重。於第一步驟中,分析濾波器排組須對齊編碼資料,亦即用在調變器的合成中的位元塑形函式(t)須對齊用於分析的濾波器(t)。此項問題係例示說明於圖12A,於該係同合成濾波器。在頂上可見三個位元。為求簡明,全部三個位元的波形皆未照比例繪製。不同位元間的時間性偏移值為Tb。底部例示說明在解碼器的同步議題:濾波器可施用在不同的時間瞬間,但只有曲線1299a為正確,且許可擷取具最佳信號對雜訊比SNR及信號對干擾比SIR的第一位元。實際上,對齊不正確將導致SNR及SIR二者的降級。將此第一對齊議題稱作為「位元同步」。一旦位元同步已經達成,則位元可被最佳地擷取。但也須得知浮水印簽章的起點在何處。本議題係例示說明於圖12B且稱作為訊息同步。於解碼位元串流中,只有標記以粗體箭頭1299b的起點位置為正確且許可解碼第k個訊息。
為了說明基本同步構思,發明人首先參考一系統,其中只有一個揚聲器輸出單一浮水印簽章。因此平均同步區塊只包含該單一浮水印簽章的位元。浮水印簽章又稱同步簽章。
此外,發明人將述及同步序列項。同步簽章可包含多個同步序列。於最簡單的情況下,同步序列可只包含單一位元。但也可能同步簽章包含多個位元。
發明人首先解決訊息同步。假設同步簽章係由Ns個同步序列以預定順序組成,其係連續地且週期性地嵌置於附浮水印音訊信號。同步模組750係能取回該等同步序列的時間性對齊。
同步模組可藉找出該等同步序列的時間性對齊而識別各個同步簽章的起點。發明人指出新同步簽章開始為同步命中的時間性位置。
同步模組的處理區塊係闡釋於圖11A及11B。同步支援單元藉分析同步簽章相關器1201的輸出而一次進行位元同步化及訊息同步化。時/頻域204中的資料係由分析模組提供。因位元同步係尚未可得,故分析模組以因數Nos過取樣資料。
輸入資料之例示說明給定於圖12C。對本實例,發明人取Nos=4,Nt=2,及Ns=3。再度,Nos指示過取樣因數,Nt指示展時因數,及Ns指示同步序列數目。如此,換言之,同步簽章係由3序列(標示以a、b、及c)組成。展時於此例中具有擴展序列ct=[1 1]T,單純在時域重複各位元兩次。
正確同步命中係標示以箭頭且相對應於各個同步簽章的起點。同步簽章的週期為Nt.Nos.Ns=Nsbl其為2.4.3=24。
由於平均同步區塊的週期性,只考慮如由積分模組740輸出的平均同步區塊即足。如圖12D闡釋,同步區塊須含有(或典型地含有)一個同步命中。平均同步區塊的各個位元為候選者同步命中。於圖12D中,平均同步區塊只為了例示說明以雙重顯示於圖式中。方塊1201的工作係運算同步區塊的各個候選者位元的可能性度量。然後此資訊送至方塊1204,其運算同步命中。
針對各個Nsbl候選者同步位置,同步簽章相關器運算可能性度量,後者愈大則愈可能發現時間性對齊(位元及部分或全部訊息同步化二者)。處理步驟係闡釋於圖11C。
據此,可獲得與不同位置選擇相聯結的可能性數值序列1201a。方塊1301進行時間性解除擴展,換言之,每個Nt位元乘以展時序列ct及然後加總。此點係對Nf頻率子帶各自進行。
圖13A顯示一個實例。取前一節描述的相同參數,亦即Nos=4,Nt=2,及Ns=3。標示候選者同步位置。從該位元,以Nos為偏移值,Nt.Ns由方塊1301所取,以序列ct解展時,故留下Ns位元。
於方塊1302,位元係與Ns擴展序列逐一元件相乘(參考圖13B)。
於方塊1303,進行展頻,換言之,各個位元乘以擴展序列cf及然後沿頻率加總。
此時,若同步位置為正確,則將具有Ns解碼位元。因位元非為接收器所已知,故方塊1304取Ns的絕對值及加總運算可能性度量。
方塊1304的輸出原理上是非同調相關器,其尋找同步簽章。實際上,當選擇小型Ns時,亦即部分訊息同步模式,可能使用彼此正交的同步序列(例如a、b、c)。如此進行時,當相關器並非正確地對齊簽章時,輸出將極小,典型地為零。當使用完整訊息同步模式時,推薦使用儘可能多個正交同步序列,然後藉小心地選擇其使用順序而產生一簽章。於此種情況下,相同理論可應用至尋找具有良好自我相關功能的擴展序列。當相關器只是略為不對齊時,則相關器的輸出將非為零,即便於理想情況下亦復如此,但總而言之將比完美對齊更小,原因在於分析濾波器無法最理想地獲得信號能。
此一同步命中方塊分析同步簽章相關器的輸出以決定同步位置在何處。因系統對高達Tb/4的不對齊相當穩健,而Tb通常耗時約40毫秒,可能隨時間積分1201的輸出以達成更穩定的同步。此點之一種可能的體現係藉沿時間施加IIR濾波器具有指數衰減脈衝響應。另外,可施加傳統FIR移動平均濾波器。一旦已經進行平均,則進行沿不同Nt.Ns的第二相關(「不同位置選擇」)。實際上,發明人想探討同步功能的自我相關函式為已知的資訊。此點係C最大可能估計器。構想係顯示於圖13C。曲線顯示於時間積分後方塊1201的輸出。決定同步命中的一個可能係單純找出此函式之最大值。於圖13D中,發明人找出以同步功能的自我相關函式濾波的相同函式(黑色)。所得函式係以粗線指示。於此種情況下,最大值更顯著,指示同步命中位置。兩個方法對高SNR相當類似,但第二方法於較低SNR方案中效能遠更佳。一旦找出同步命中,則送至浮水印擷取器202,其解碼該資料。
多於一個浮水印簽章:
系統也可採用由不同揚聲器所輸出的二或更多個浮水印簽章,其中該等浮水印簽章為時間多工化。圖10例示說明此種時間多工化浮水印簽章。於此種情況下,同步模組750分開地搜尋嵌入式浮水印簽章中之各者。因此,檢測如同揚聲器般儘可能地多個同步命中位置,使用不同浮水印信號且遞送此等同步命中位置給方向估計器760。
據此,前述構思找出同步簽章的同步命中位置針對各個浮水印係重複地施加。如此,針對各個浮水印,決定平均同步區塊內部的同步命中位置。參考圖11A-13D,針對各個浮水印,重複進行決定各個浮水印的同步命中位置,該所考慮的浮水印之浮水印簽章係採用作為同步簽章。
然後記錄的信號劃分為M個節段,各個節段M屬於某個揚聲器的某個浮水印。然後針對各節段選行抵達方向的估計。結果,方向估計器760將具有M個輸出,各自表示由某個揚聲器發出的聲音之抵達方向。
同步模組750提供在平均同步區塊內部的一或多個同步命中位置,及遞送該同步命中位置給方向估計器760。
於其它實施例中,若浮水印係連續地嵌入且只使用一個揚聲器,則無需計算同步命中。若非如此,則須進行同步化來找出方向估計的起點。 4.6積分模組741、742、...、74N:
回頭參考圖7,分析模組711、712、...71N不僅提供時頻域信號S1、S2、...、SN給選擇模組720,同時也提供信號S1、S2、...、SN給積分模組741、742、...、74N。遞送給積分模組741、742、...、74N者實際上為(過取樣)標準化複合係數(j,q),其係與提供給選擇模組720的相同係數。
但在過取樣標準化複合係數饋至積分模組741、742、...、74N之前未進行微分解碼,原因在於需要包含在複合係數的相位資訊,該資訊在微分解碼後將喪失。取而代之,須維持信號的相位資訊。藉施加微分解碼,將拋棄此一資訊。
於積分模組741、742、...、74N各者中及針對各個子帶i,首先,包含過取樣標準化複合係數的串流係劃分成隨後週期性區塊p11、p12、p13。複合係數串流係恰以微分解碼位元串流已經分離成週期性區塊p1、p2、p3之相同方式劃分為多個區塊。具有相對應於時間指數及(過取樣位置)的位元及樣本係包含於相對應的週期性區塊。
此點係參考圖7及圖14說明。於圖7中,信號s1係提供給分析模組711。分析模組711產生包含多個子帶信號的時頻域信號S1,子帶信號各自係表示為複合係數串流。於一個實施例中,選擇模組720可選擇S1,使得基於時頻域信號S1隨後進行同步化。
於圖14中,考慮時頻域信號S1的特定子帶。此子帶可包含複合係數c(i,j),其中i表示子帶及j表示時間指數。舉例言之,考慮此一子帶的複合係數c(i,1)、c(i,2)、c(i,3)、c(i,4)、c(i,5)、及c(i,6)。藉微分解碼器基於此等值的微分解碼,提供六個軟位元,亦即基於c(i,1)及前一個子帶樣本的d(i,1);基於c(i,2)及前一個c(i,1)的d(i,2);基於c(i,3)及前一個c(i,2)的d(i,3);基於c(i,4)及前一個c(i,3)的d(i,4);基於c(i,5)及前一個c(i,4)的d(i,5);及基於c(i,6)及前一個c(i,5)的d(i,6)。於d(i,j)中,i表示子帶及j表示時間指數。
頻帶i的複合係數也饋至圖7的積分模組741。若積分模組740現在將包含軟位元d(i,1)、d(i,2)、d(i,3)、d(i,4)、d(i,5)、及d(i,6)的微分解碼位元序列劃分成包含d(i,1)、d(i,2)及d(i,3)的第一週期性區塊p1及包含d(i,4)、d(i,5)及d(i,6)的第二週期性區塊p2,則複合係數c(i,1)、c(i,2)、c(i,3)、c(i,4)、c(i,5)、及c(i,6)也劃分成兩個區塊亦即,包含c(i,1)、c(i,2)及c(i,3)的第一週期性區塊及包含c(i,4)、c(i,5)及c(i,6)的第二週期性區塊(參考圖14)。
相同適用於由其它分析模組71N所產生的其它時頻域信號SN,即便此等信號尚未用於藉微分解碼器執行的微分解碼亦復如此。
若考慮過取樣時,前述構思也同等適用。若過取樣軟位元b(i,j,q)被劃分成第一及第二週期性區塊p1及p2,則複合係數c(i,j,q)被劃分成第一及第二週期性區塊p11及p12。(此處,i指示子帶,j指示時間指數,及q指示過取樣位置)。若第一週期性區塊p1包含軟位元b(i,j,q),則第一區塊p11包含有相同指數j、q的複合係數c(i,j,q)。若第二週期性區塊p2包含軟位元b(i,j,q),則第二區塊p12也包含有相同指數j、q的複合係數c(i,j,q)。
如此,由積分模組741、742、...、74N產生的週期性區塊p11、p12、p13各自的長度係相對應於由積刺模組740產生的週期性區塊p1、p2、p3的長度。
為了針對各個子帶i形成平均週期性區塊,相對應複合係數求平均。舉例言之,不同週期性區塊的複合係數相加。舉例言之,第一、第二及第三同步週期的第一複合係數相加,第一、第二及第三浮水印週期的第二複合係數相加等等。各個所得複係除以求平均的週期性區塊之數目。結果獲得下式:,其中j=0,1,2,...,Nsync-1本式中,K表示求平均的關注子帶i的週期性區塊數目,k表示關注的實際週期性區塊,而j為在週期性區塊內部的複合係數位置。
將具Nos過取樣因數的過取樣列入考慮,如此獲得下式:,其中j=0,1,2,...,Nsync-1其中q=1,2,...,Nos,指示考慮的複合係數內部的過取樣位置。
對各頻帶及各信號決定平均週期性區塊。
此種形成平均週期性區塊的效應係參考圖15A及圖15B作說明。圖15A及15B例示說明積分如何輔助獲得期望的浮水印信號的相位資訊。
當使用數個揚聲器時,出現眾所周知的現象,亦即虛幻影像源。於此種情況下,發出的聲音係接收彷彿由位在多個揚聲器間的一個音源播放般。此亦屬抵達方向估計的情況,原因在於記錄的浮水印信號的音訊部分係與浮水印部分成比例地加倍。此項問題的解決方案係使用積分模組441、442、...、44N,現在詳細說明如下。
圖15A顯示藉假設理想聲道,針對某個頻率子帶l及不同時槽i,一個經記錄且經分析信號Sn之音訊部分的複合向量及浮水印信號部分的複合向量。此處Amn表示由揚聲器m所發出而由麥克風n所接收的音訊部分。須注意於TDMA實例中,當注視給定時槽時,記錄的信號包含全部發出音訊信號連同只有一個浮水印信號的重疊。K表示欲積分的同步區塊數目。Nsynch表示針對一個完整同步區塊的時槽數目。包含針對全部揚聲器的不同同步簽章:Nsynch=M.Nseq,於該處M為揚聲器數目及Nseq為一個同步簽章的序列數目。音訊部分的複合向量從一個時槽旋轉至另一個時槽。但相反地,浮水印信號之相位幾乎維持相同。
圖15B中例示說明執行積分後的情況。所得音訊信號的複合向量幾乎消失,而所得浮水印的向量維持。因此,藉使用所記錄的輸入信號之相位資訊來達成入射角之估計之方法,接收有用的資料以獲得針對各個揚聲器抵達方向之一可行估值。
位元積分後,可得針對不同麥克風611、612、...、61N之各個所接收的信號S1、S2、...、SN及針對各個頻帶i的積分複合係數。
目前不考慮過取樣,解釋本發明所植基的若干原理。於本實施例之脈絡中採用相位調變係基於若干基本構想:假設各個取樣複合係數係相對應於編碼位元位置,實際樣本相位值係與前一個樣本的相位值作比較。例如考慮二進制相移鍵控(BPSK)。若二樣本的相位值為相同,此係相對應於第一編碼位元值,例如編碼位元值為1。但若二相位值差異例如達180度(或±π),則此係相對應於第二編碼位元值,例如編碼位元值為-1。如此為了相位調變,例如採用二進制相移鍵控,重要地接續位元位置樣本具有相同相位值或差異達180度(或±π)的相位值。因此,當編碼相位調變值時,取決於編碼位元值,採用調變使得相對應於接續位元位置的樣本之相位值為相等或相異達180度。
有關某個浮水印簽章及某個頻帶,揚聲器傳輸由相位調變編碼的一位元序列。全部音訊接收器例如麥克風接收經相位調變的位元序列。針對不同麥克風的全部信號,相對應於所接收的音訊信號S1、S2、...、SN的隨後位元位置須(接近)相同。若二麥克風同時接收該音訊信號的相同部分,則絕對相位值也應相同。但因麥克風分開(但可只略為分開),第一麥克風可只比第二麥克風略早接收該音訊信號的相同部分,例如若第一麥克風係比第二麥克風更靠近揚聲器。此種二接收時域信號的時間差導致二接收頻域信號例如時頻域信號的相位差。因此,由兩個麥克風所接收的附浮水印信號的相位差包含有關發出該附浮水印信號的揚聲器位置相對於二麥克風位置之資訊。 4.7方向估計器760:
積分模組741、742、...、74N將針對各頻帶及各信號決定的平均週期性區塊饋入方向估計器760,其已接收同步命中位置。然後,當由針對各個平均週期性區塊的同步命中位置指向輸入資料部分時,方向估計器760執行抵達方向的估計。
後文中,發明人將聚焦在系統只包含一個揚聲器發出單一浮水印的情況。但本發明係同等適用於發出多於一個浮水印的情況。於此種情況下,針對各個傳輸的浮水印提供一個同步命中位置,然後基於該同步命中位置,且基於該浮水印長度將該平均週期性區塊劃分成不同節段。然後下列構思適用於各個浮水印簽章及其平均週期性區塊之節段。 4.7.1捨棄在不正確過取樣位置的樣本:
於第一步驟中,方向估計器基於平均週期性區塊執行樣本積分。針對各個位元,只考慮由同步命中位置指示為正確過取樣位置的該過取樣位置。全部其它過取樣位置皆被捨棄而在樣本積分中不考慮。 4.7.2反相-1位元:
然後,始於第一浮水印簽章的第一位元而逐一位元考慮浮水印簽章。在平均週期性區塊中的相對應樣本值位置係以同步命中位置指示。考慮浮水印簽章的全部位元及其相對應樣本值。於使用BPSK作為調變方案的一個實施例中,1之位元值係由實際樣本及先前樣本的相等相位值指示,而-1之位元值係由實際樣本及先前樣本的180度相位差指示。此點例示說明圖15C。複合係數之樣本值序列以1510闡釋。位元序列1515指示編碼位元,設採用微分編碼。同步模組現在產生平均複合係數之已處理序列1520,使得全部複合係數粗略具有相等相位值,留下複合係數不變,或改變相位值達180度。複合係數的相位值是否改變180度的決策係基於浮水印的編碼位元序列決定。
舉例言之,基於浮水印簽章,一種裝置可計算一位元值是否已經藉使用具有期望的第一相位值之複合係數編碼,或一位元值是否已經藉使用具有非期望的第二相位值之複合係數編碼。若相對應樣本值已經決定為具有非期望的第二相位值,則此複合係數的相位值改變180度。
藉此,雖然在處理前,一頻帶的複合係數具有第一絕對相位值或與第一相位值差異約180度的第二絕對相位值,但有關某個麥克風的某個頻域信號,已處理後的平均複合係數序列之針對某個頻率的複合係數之絕對相位值現在具有幾乎相等。 4.7.3樣本積分
調整樣本的相位後,全部複合係數具有粗略等值的相位值。同步模組750現在以逐一樣本基準進行積分。與所考慮的浮水印簽章之全部其餘樣本值(具有正確過取樣位置的取樣值)係經積分,亦即取平均,例如相加及除以相加的樣本數來獲得平均複合係數1530。
獲得兩個效果:至於第一效果,獲得更穩定的絕對相位值。不同樣本可暴露於聲道內部的起伏波動,使得不同相位值具有粗略相同的絕對相位值,但非確切相同相位值。至於第二效果,在平均樣本內部的音訊信號之影響為最小化,同時強調浮水印簽章的效果。
如此,針對不同麥克風611、612、...、61N及針對各個頻帶i可為平均複合係數中之各者決定(絕對)相位值。該相位值為一平均相位值。因複合係數為複合數,故一複合係數的絕對相位值可藉決定一複合係數的相位值(自變數)決定。
但須注意不同頻帶的複合係數可具有不同相亥值,如圖15D之例示說明。 4.7.4方向決定:
基於所決定的相位資訊,可以其它決定構思為基礎而決定各型方向資訊。藉使用取決於麥克風陣列之組態的方法及使用輸入信號間例如方向性音訊編碼(DirAC)或透過自旋恆定之信號參數的估計技術(ESPRIT)的相位差,獲得抵達方向之估值。
於DirAC中,藉使用B格式麥克風信號分析聲場,該信號係包含一全向信號w(t)及三個偶極信號x(t)、y(t)、z(t),相對應於笛卡爾座標系的x、y及z軸。
圖16例示說明6麥克風的一種麥克風配置,使其形成三對麥克風。第一對麥克風mx1、mx2係位在笛卡爾座標系的x軸。第二對麥克風my1、my2係配置成位在笛卡爾座標系的y軸。此外,第三對麥克風mz1、mz2係配置成位在笛卡爾座標系的z軸。
考慮某個頻帶i,有關針對所考慮的頻帶i之所考慮的浮水印簽章已決定的絕對相位值針對麥克風mx1係稱作vx1,針對麥克風mx2係稱作vx2,針對麥克風my1係稱作vy1,針對麥克風my2係稱作vy2,針對麥克風mz1係稱作vz1,及針對麥克風mz2係稱作vz2。然後,可計算相位差△vx、△vy、及△vz如下:△vx=vx1-vx2;△vy=vy1-vy2;△vz=vz1-vz2;方位角之決定:於一個實施例中,方位角可基於求出的相位值計算。考慮如圖17例示說明的於xy平面中的麥克風mx1及mx2位置。指出二麥克風間距d。載明輸出浮水印簽章的一音源方向的角φ係就xy平面載明。φ=0相對應於一波同時命中麥克風。亦即音源假設為距mx1與距mx2同等距離。採用下式:△vx=(-2.π/λ).d.sin(φ)於本方程式中,λ為波長且係定義為λ=c/fi,其中c為音速,及其它fi為所關注子帶的中心頻率。fi可相對應於針對前述所關注子帶在位元形成函式中的fi。d為二麥克風間距,及φ指示欲決定的相對於xy平面的抵達方向。
此外,sin(φ)為:sin(φ)=-△vx.λ/(2.π.d) (I)如此,可決定sin(φ)值。
假設φ係在範圍]-π,π]。若sin(φ)為-1或1,則φ可不含混地決定。但若sin(φ)非為-1或1,則φ可為兩個不同值中之一者。例如若sin(φ)=0,則φ為0或π。
為了解析此種模糊不明,可採用來自額外麥克風的資訊。如圖17例示說明,考慮麥克風my1及my2的位置。再度指示二麥克風間距d。該距離可與麥克風mx1及mx2間距相同或相異。載明輸出浮水印簽章的一音源方向的角β係就xy平面載明。β=0相對應於一波同時命中麥克風。亦即音源假設為距mx1與距mx2同等距離。採用下式:△vy=(-2.π/λ).d.sin(β)
如此導致下式:sin(β)=-△vy.λ/(2.π.d)
於圖17例示說明之實施例中,β=φ-π/2。(於其它實施例中,β可為β=φ+π/2)。因此,sin(β)=sin(φ-π/2)=-cos(φ)及如此cos(φ)=△vy.λ/(2.π.d) (II)
再度,若cos(φ)係非為-1或1,α可為二值中之一者。
藉依式(I)計算sin(φ)及藉依據式(II)計算cos(φ),及基於sin(φ)及cos(φ)決定φ,可不含混地決定φ值。
藉此,就xy平面及某個頻帶i,可決定載明包含該浮水印簽章的聲波之抵達方向的角φ。
針對多個不同頻帶i各自可重複決定角φ。針對各個頻帶,獲得角φ,其針對各個頻帶須接近相同。但有關某些頻帶的干擾可能影響基於此等頻帶決定的角φ之決定值的正確度。於一個實施例中,求出角φ之決定值。舉例言之,求出的角度值可相加且除以加數來獲得角φ值為平均值。
從方位角φ決定抵達向量之方向:抵達向量之方向可計算為a=(cos(φ),sin(φ))。抵達向量之方向的另一項決定:於一個實施例中,抵達向量之方向係基於求出的相位值決定如下:回頭參考圖17,如前文解說,藉施用△vx=vx1-vx2;△vy=vy1-vy2;及△vz=vz1-vz2;可求出絕對相位值的相位差△vx、△vy、及△vz。
於一個實施例中,假設麥克風mx1與mx2間之距離dx、麥克風my1與my2間之距離dy、及麥克風mz1與mz2間之距離dz為相等。
然後當△vx、△vy、及△vz係於範圍]-π;π]表示時,△vx、△vy、及△vz形成抵達向量之方向a的成分。
a=(△vx,△vy,△vz)其係指向音源方向。
於又一個實施例中,假設麥克風mx1與mx2間之距離dx、麥克風my1與my2間之距離dy、及麥克風mz1與mz2間之距離dz為不相等。於此一實施例中,已修正相位差須經調整而考慮不同距離,例如藉施加校正因數。舉例言之,成分ax、ay及az可依據下式決定:ax=(1/dx).△vx;ay=(1/dy).△vy;az=(1/dz).△vz使得抵達向量之方向獲得a=(ax,ay,az)。
於額外實施例中,向量a例如可藉其成分乘以因數k而標準化,例如,
抵達向量之方向係參考圖18A至圖18D作說明。為了更明白解說,說明於二維xy平面的情況。假設麥克風mx1與mx2間之距離dx與麥克風my1與my2間之距離dy為相等。但給定之說明也適用於三維情況,及適用於麥克風距離為不等的情況,但於該處距離△vx及△vy已經調整,例如藉施加距離因數而予調整。
考慮抵達向量之方向a=(△vx,△vy,△vz)。其成分△vx、△vy、△vz為藉前述實施例所得的相位差。用於例示說明目的,只考慮向量a’=(△vx,△vy)的x及y成分。
於圖18A中,考慮二成分抵達向量之方向a’=(0,1)。
向量△vx的x成分為0,亦即相對於由麥克風mx1及mx2二者接收的信號之絕對相位值並不存在有相位差。如此相對應音波同時命中二麥克風mx1及mx2,及假設聲波與二麥克風mx1及mx2的間隔距離相等。結果抵達向量之方向a’既非負也非正。
向量△vy的y成分為1。因△vy=vy1-vy2,如此指示絕對相位值vy1係大於絕對相位值vy2,如此個別音波抵達麥克風my1係比麥克風my2更早。如此,抵達向量之方向a’指向y軸的正向。
於圖18B中,考慮二成分抵達向量之方向a’=(-1,0)。
向量△vy的y成分為0,亦即相對於由麥克風my1及my2二者接收的信號之絕對相位值並不存在有相位差。如此相對應音波同時命中二麥克風my1及my2,及假設聲波與二麥克風my1及my2的間隔距離相等。結果抵達向量之方向a’既非負也非正。
向量△vx的x成分為-1。因△vx=vx1-vx2,如此指示絕對相位值vx2係大於絕對相位值vx1,如此個別音波抵達麥克風mx2係比麥克風mx1更早。如此,抵達向量之方向a’指向x軸的負向。
於圖18C中,考慮二成分抵達向量之方向a’=(1,1)。
向量△vx的x成分為1。因△vx=vx1-vx2,如此指示絕對相位值vx1係大於絕對相位值vx2,如此個別音波係比麥克風mx2更早抵達麥克風mx1。如此,抵達向量之方向a’指向x軸的正向。
向量△vy的y成分為1。因△vy=vy1-vy2,如此指示絕對相位值vy1係大於絕對相位值vy2,如此個別音波係比麥克風my2更早抵達麥克風my1。如此,抵達向量之方向a’指向y軸的正向。
因相位差△vx與△vy相等,且因可假設相對應音波於x方向與y方向同等快速傳播,抵達向量之方向的x成分與y成分具有等值。
於圖18D中,考慮二成分抵達向量之方向a’=(2,1)。
向量△vx的y成分為2。因△vx=vx1-vx2,如此指示絕對相位值vx1係大於絕對相位值vx2,如此個別音波係比麥克風mx2更早抵達麥克風mx1。如此,抵達向量之方向a’指向x軸的正向。
向量△vy的y成分為1。因△vy=vy1-vy2,如此指示絕對相位值vy1係大於絕對相位值vy2,如此個別音波係比麥克風my2更早抵達麥克風my1。如此,抵達向量之方向a’指向y軸的正向。
因相位差△vx與△vy相等,且因發明人可假設相對應音波於x方向比y方向更快速傳播,於x方向的速度為於y方向速度的兩倍,抵達向量之方向的x成分為y成分的大小的兩倍。
基於多個頻帶決定抵達向量之方向:如前文解說,基於某個頻帶的相位值決定抵達向量之方向。於一個實施例中,抵達向量之方向係針對多個頻帶計算以獲得多個抵達向量之方向。然後多個頻帶向量可經標準化,例如藉其成分乘以向量特定標準化因數來獲得標準化抵達向量之方向。例如,針對各個頻帶,例如依據下式決定向量特定標準化因數n:,於該處fi為第i個子帶的中心頻率。
然後,可決定平均抵達向量之方向。求取平均例如可藉加總多個抵達向量之方向,及藉將所成向量成分除以平均的標準化抵達向量之方向數目而達成。
於一個實施例中,方位角及仰角可使用於方向性音訊編碼(DirAC)脈絡中採用的方法,基於所決定的抵達向量之方向求出。
抵達向量之方向另外使用複合接收器特定資訊估計:於又一個實施例中,有關針對一所關注頻帶i的所關注的浮水印簽章之複合值,可用來使用方向性音訊編碼(DirAC)技術估計抵達方向。
設△px表示得自圖16的麥克風mx1及mx2的複合值間之差。同理,△py及△pz係對y及z軸獲得。進一步設p0為在全部麥克風所得複合值的平均。
抵達向量之方向a係從主動強度向量Ia=(Iax,Iay,Iaz)計算得,定義為Iax=.5 Real(p0.conj(△px)) Iay=.5 Real(p0.conj(△py)) Iaz=.5 Real(p0.conj(△pz)),於該處Real( )擷取實數部分,及conj表示複合共軛,及於該處.5表示0.5。
抵達向量之方向為a=-Ia/norm(Ia),於該處norm( )運算自變數的L2範數。方位角及仰角方便計算為azimuth=atan(Iay/Iax) elevation=atan(norm(Ia),sqrt(Iax^2+Iay^2)),於該處sqrt為平方根,於該處Iax^2表示Iax2,及於該處Iay^2表示Iay2
記錄單元的位置估計
圖19例示說明於二維場景的位置評估。發明人假設揚聲器位置為已知。發明人進一步假設揚聲器及記錄麥克風陣列係位在同一個平面。
依據前述實施例中之一者,針對揚聲器各自決定抵達向量之方向。第一揚聲器的抵達向量之方向係針對第一揚聲器。第二揚聲器的抵達向量之方向係針對第二揚聲器。
基本上,抵達向量之方向係指向來自一揚聲器的聲波抵達方向,其中該向量成分可參考笛卡爾座標系表達。但於實施例中,座標系的軸係藉麥克風位置定義:mx1及mx2的位置定義該抵達向量之方向指向座標系的x軸,及my1及my2位置定義座標系的y軸。
若麥克風陣列的方向為已知,及若二揚聲器的(絕對)位置為已知,二抵達向量之方向在二維情況為足夠來定義麥克風陣列的位置。此點係例示說明於圖19。
於此一實施例中,一種用於位置估計的裝置係適用以計算針對各個揚聲器輸出包含浮水印簽章的聲波之抵達向量之方向。二維平面的第一線經計算,平行於第一揚聲器的抵達向量之方向,及交叉第一揚聲器的位置。此外,二維平面的第二線經計算,平行於第二揚聲器的抵達向量之方向,及交叉第二揚聲器的位置。於該二維平面的第一線與第二線的交叉點經計算,其中該交叉點決定麥克風陣列之位置。
於又一個實施例中,描述的構想係應用於環境,其中該麥克風陣列及揚聲器並非位在二維平面,施加抵達向量之三維方向(含三個成分之抵達向量之方向)。於該處假設揚聲器位置為已知。該裝置計算平行於所決定的抵達向量之方向的線,其中該計算線交叉抵達向量之方向的揚聲器位置。全部計算線彼此交叉點為所決定的麥克風陣列之位置。
為了例示說明目的,回頭參考二維情況。若麥克風陣列之方向非為已知,則兩個揚聲器之抵達向量之二方向並不足以決定麥克風陣列之位置。於此種情況下,可計算第一與第二抵達向量之方向間的夾角α,但至於麥克風陣列之方向性,及如此藉該麥克風陣列界定的座標系的方向性非為已知,麥克風陣列之位置無法不含混地定義,即便揚聲器位置(例如指稱第二座標系表達)為已知亦復如此。此點係例示說明於圖20A。
但藉採用第三揚聲器輸出包含浮水印簽章的第二音波,可解決模糊不明。此點係參考圖20B解說。若升計至少三個揚聲器的抵達方向(M3),也決定麥克風陣列的空間位置。圖21例示說明一相對應的位置估計器。當使用三個揚聲器,假設揚聲器位置及記錄單元係在共用平面。但揚聲器的空間位置已知係在接收器。仰賴此項資訊,可能藉位置估計器800解出非線性方程式系統而獲得記錄位置。
於圖20B之實施例中,位置估計裝置計算第一揚聲器的第一抵達向量之方向,第二揚聲器的第二抵達向量之方向,及第三揚聲器的第三抵達向量之方向。然後,可計算第一與第二抵達向量之方向間之第一夾角α,及第二與第三抵達向量之方向間之第二夾角δ。然後決策估計裝置決定於二維平面的點,使得各自交叉揚聲器位置及所決定點的三條線具有相對於彼此的決定角度關係。換言之,交叉第一揚聲器位置的第一線及交叉第二揚聲器位置的第二線彼此交叉於決定點,使得其交叉點係等於第一角。交叉第二揚聲器位置的第二線及交叉第三揚聲器位置的第三線彼此交叉於決定點,使得其交叉點係等於第二角。決定點為麥克風陣列之位置。
於又一個實施例中,位置估計器決定麥克風陣列之位置,其方向針對三維情況非已知,亦即揚聲器及麥克風陣列的組態並非全部位在二維平面。藉採用三維抵達向量之方向,亦即具有三個成分的抵達向量之方向,基於前述構想達成決定。
圖22例示說明依據一實施例一種空間位置估計裝置。空間位置估計裝置包含依據前述實施例中之一者用以提供方向資訊的裝置100,裝置100處理所接收附浮水印音訊信號rx1、rx2。此外,空間位置估計裝置包含一位置估計器300,用以供計空間位置估計裝置之一位置。位置估計器係適用以基於由方向資訊提供裝置所提供的方向資訊而估計空間位置估計裝置的位置。
雖然已經就裝置的脈絡描述若干構面,顯然此等構面也表示相對應方法的描述,於該處一區塊或裝置相對應於一方法步驟或一方法步驟的特徵。類似地,於方法步驟的脈絡中描述的構面也表示一相對應區塊的描述或一相對應裝置的項目或特徵。
本發明之分解信號可儲存在數位儲存媒體上,或可傳輸至傳輸媒體,諸如無線傳輸媒體或有線傳輸媒體諸如網際網路。
取決於某些體現要求,本發明之實施例可於硬體或軟體體現。該體現可使用下列數位儲存媒體執行:軟碟、DVD、CDROM、PROM、EPROM、EEPROM或快閃記憶體,其與可程式規劃電腦系統協作(或可協作)使得執行個別方法。
依據本發明之若干實施例包含具有可電子讀取控制信號的非過渡資料載體,其可與可程式規劃電腦系統協作,使得執行此處所述方法中之一者。
概略言之,本發明之實施例可體現為具有程式代碼的電腦程式產品,當該電腦程式產品係在電腦上跑時,該程式代碼可操作來執行該等方法中之一者。該程式代碼例如可儲存在電腦可讀取載體上。
其它實施例包含儲存在機器可讀取載體上用以執行此處所述方法中之一者的電腦程式。
換言之,因此本發明方法之實施例為當該電腦程式產品係在電腦上跑時,該程式代碼可操作來執行該等方法中之一者。
因此,本發明之又一實施例為一種資料載體(或數位儲存媒體,或電腦可讀取媒體)包含執行該等方法中之一者的電腦程式記錄於其上。
因此,本發明之又一實施例為一種資料串流或信號序列,表示用以執行此處所述方法中之一者的電腦程式。資料串流或信號序列例如可經組配來透過資料通訊連結,例如透過網際網路傳輸。
又一實施例包含一種處理裝置,例如電腦,或可規劃邏輯裝置係經組配來或適用以執行此處所述方法中之一者。
又一實施例包含一種電腦其上儲存有用以執行此處所述方法中之一者的電腦程式。
於若干實施例中,一種可規劃邏輯裝置(例如可現場程式規劃閘陣列)可用以執行此處所述方法中之一者的部分或全部功能。於若干實施例中,可現場程式規劃閘陣列可與微處理器協作以執行此處所述方法中之一者的電腦程式。大致上,該方法較佳地係藉任一硬體裝置執行。
前述實施例僅供舉例說明本發明之原理。須瞭解此處所述的配置及細節的修改及變化將為熟諳技藝人士顯然易知。因此意圖僅受隨附之申請專利範圍所限而非藉此處實施例的描述及解說所呈現的特定細節所限。
100‧‧‧裝置、方向資訊提供裝置
102、502‧‧‧心理聲學處理模組
110‧‧‧信號處理器
120‧‧‧方向資訊提供器
202‧‧‧浮水印擷取器
204‧‧‧時/頻域
210、mx1-2、my1-2、mz1-2‧‧‧麥克風
221、222‧‧‧音訊接收器
307‧‧‧調變器
310‧‧‧浮水印簽章
320‧‧‧展頻浮水印
330‧‧‧展頻及展時浮水印簽章
401-40Nf‧‧‧輸入
411至41Nf‧‧‧位元塑形區塊
441-44N、741-74N、740‧‧‧積分模組
500‧‧‧浮水印插入器
501‧‧‧浮水印產生器
501a‧‧‧二進制資料
501b‧‧‧浮水印信號
502‧‧‧心理聲學處理模組
504、505‧‧‧資訊
506‧‧‧音訊信號
507‧‧‧附浮水印音訊信號
605‧‧‧組合單元
610‧‧‧揚聲器
611-61N、610‧‧‧揚聲器
621-62N‧‧‧麥克風、感測器
711-71N‧‧‧分析模組
720‧‧‧選擇模組
730‧‧‧微分解碼器
750‧‧‧同步模組
760‧‧‧方向估計器
800‧‧‧位置估計器
1201‧‧‧同步簽章相關器
1201、1204、1301-1304‧‧‧方塊
1201a‧‧‧序列
1299a‧‧‧曲線
1299b‧‧‧粗體箭頭標示起點位置
1510‧‧‧複合係數之樣本值序列
1515‧‧‧位元序列
1520‧‧‧平均複合係數之已處理序列
1530‧‧‧平均複合係數
a‧‧‧向量、音訊信號
awm、awm1-awmM‧‧‧再現音訊信號
di‧‧‧方向資訊
DOA、DoA1-DoAM‧‧‧抵達方向
LS1-2‧‧‧音訊源
mx1-2、my1-2、mz1-2‧‧‧麥克風
rsi1-2‧‧‧接收器特定資訊
rx1-2‧‧‧所接收附浮水印音訊信號
S1-SN‧‧‧時頻域信號
s1-sN‧‧‧信號
sw‧‧‧聲波
wm、wm1-wmM‧‧‧浮水印簽章
WM1-2‧‧‧浮水印信號部分
圖1顯示依據一實施例一種提供方向資訊之裝置的示意方塊圖,圖2例示說明依據一實施例一種提供方向資訊之裝置於一應用場景,圖3A-3C例示說明展頻及展時的一浮水印,圖4顯示一種產生一浮水印信號之調變器,圖5闡釋一種產生浮水印信號的裝置,圖6A-6B例示說明依據一實施例一種提供方向資訊之裝置於又一應用場景,圖7例示說明依據一實施例一種提供方向資訊之裝置的組件,圖8A提供依據一實施例當採用過取樣時,在時頻平面上係數之位置的綜覽實例,圖8B例示說明包含嵌入式浮水印之一時頻域子帶信號,圖9A-9D闡釋依據一實施例浮水印簽章、同步區塊、週期性區塊、及平均同步區塊,圖10例示說明依據一實施例的多工浮水印,圖11A-11D顯示一種同步支援單元的替代體現之示意圖,圖11C顯示一種同步簽章相關器之方塊示意圖,圖12A顯示找出一浮水印的時間性對齊問題之圖解代表圖,圖12B顯示識別訊息起始問題之圖解代表圖,圖12C顯示用於同步化資料之圖解代表圖,圖12D顯示識別一同步命中構思之圖解代表圖,圖13A顯示時間性解除擴展之一實例的圖解代表圖,圖13B顯示在位元與展頻序列間之逐一元件乘法之一實例的圖解代表圖,圖13C顯示於時間性平均後,同步簽章相關器之一輸出之圖解代表圖,圖13D顯示具有以同步簽章的自我校正函式濾波的同步簽章相關器之一輸出之圖解代表圖,圖14例示說明包含差異解碼位元之週期性區塊與包含複合係數之週期性區塊間之關係,圖15A闡釋一音訊信號部分的及一浮水印信號部分的複合向量,圖15B闡釋音訊信號部分的一平均複合向量及浮水印信號部分的一平均複合向量,圖15C例示說明於不同階段的樣本積分,圖15D例示說明不同子帶的兩個積分複合係數,圖16例示說明沿笛卡爾座標系的軸配置之六個麥克風,圖17顯示依據一實施例於xy平面之方位角決定,圖18A-D闡釋依據一實施例決定的抵達向量之方向,圖19例示說明依據一實施例的位置估計,圖20A-B闡釋位置估計挑戰及解決方案,圖21例示說明依據一實施例一種位置估計之裝置,及圖22例示說明依據一實施例一種空間位置估計之裝置。
100‧‧‧裝置
110‧‧‧信號處理器
120‧‧‧方向資訊提供器
di‧‧‧方向資訊
rsi1-2‧‧‧接收器特定資訊
rx1-2‧‧‧所接收附浮水印音訊信號
权利要求:
Claims (18)
[1] 一種基於具有一嵌入式浮水印的一再現性音訊信號提供方向資訊之裝置,該裝置係包含:一信號處理器,其係適用以處理由在不同空間位置的至少二音訊接收器所記錄的至少二所接收的附浮水印音訊信號,其中該等音訊接收器係適用以記錄該再現性音訊信號的聲波而獲得該所接收的附浮水印音訊信號,各個所接收的附浮水印音訊信號包含該嵌入式浮水印,其中該信號處理器係適用以處理該所接收的附浮水印音訊信號而獲得針對各個所接收的附浮水印音訊信號之一接收器特定資訊,該接收器特定資訊係取決於嵌入在該等所接收的附浮水印音訊信號內之該等嵌入式浮水印,及一方向資訊提供器,其係基於針對各個所接收的附浮水印音訊信號之該接收器特定資訊而提供方向資訊。
[2] 如申請專利範圍第1項之裝置,其中該信號處理器係包含一分析模組,其係用以將該所接收的附浮水印音訊信號從一時域轉換成一時頻域以獲得包含多個子帶信號之一時頻域傳輸信號。
[3] 如申請專利範圍第1項之裝置,其中該信號處理器係適用以決定一複合數作為該接收器特定資訊。
[4] 如申請專利範圍第1項之裝置,其中該信號處理器係適用以決定相位資訊作為該接收器特定資訊。
[5] 如申請專利範圍第4項之裝置,其中該信號處理器係適用以基於一所決定的平均複合係數而決定一平均相位值作為該相位資訊。
[6] 如申請專利範圍第5項之裝置,其中該信號處理器係適用以藉決定包含一子帶信號的已處理之複合係數的一平均週期性區塊而產生該平均複合係數。
[7] 如申請專利範圍第2項之裝置,其中該信號處理器係適用以決定相位資訊作為該接收器特定資訊,其中該信號處理器係適用以基於一所決定的平均複合係數而決定一平均相位值作為該相位資訊,及其中該信號處理器係適用以藉決定包含該等多個子帶信號中之一者的已處理複合係數之一平均週期性區塊而產生該平均複合係數。
[8] 如申請專利範圍第6項之裝置,其中該信號處理器係適用以藉組合該等子帶信號之已處理複合係數中之至少二者而決定平均複合係數,其中該等已處理複合係數係具有相等相位值或差異不超過0.5弧度度量的相位值。
[9] 如申請專利範圍第6項之裝置,其中該信號處理器係適用以藉改變該等複合係數中之至少一者的該相位值達一預定數而產生該已處理的複合係數。
[10] 如申請專利範圍第1項之裝置,其中該信號處理器係適用以決定一同步命中位置,其指示編碼一浮水印簽章之一第一位元的一複合係數之一位置。
[11] 如申請專利範圍第6項之裝置,其中該信號處理器係適用以決定一同步命中位置,其指示編碼嵌置於該所接收的附浮水印音訊信號內的該嵌入式浮水印的一浮水印簽章之一第一位元的一複合係數中之至少一者之一位置。
[12] 如申請專利範圍第1項之裝置,其中該方向資訊提供器係適用以採用一複合數來決定與提供方向資訊。
[13] 如申請專利範圍第1項之裝置,其中該方向資訊提供器係適用以提供一抵達向量方向作為方向資訊。
[14] 一種提供方向資訊之方法,該方法係包含:接收附浮水印音訊信號,各個所接收的附浮水印音訊信號係包含一嵌入式浮水印,處理由在不同空間位置的至少二音訊接收器所記錄的至少二所接收的附浮水印音訊信號以決定針對各個所接收的附浮水印音訊信號之一接收器特定資訊,其中該接收器特定資訊係取決於嵌入在該等所接收的附浮水印音訊信號內之該等嵌入式浮水印,及基於針對各個所接收的附浮水印音訊信號之該接收器特定資訊而提供方向資訊。
[15] 一種電腦程式,當該電腦程式係由一電腦或處理器執行時其係用以執行如申請專利範圍第14項之方法。
[16] 一種空間位置估計裝置,該裝置係包含:如申請專利範圍第1至13項中任一項之提供方向資訊之一裝置,及一用以估計該提供方向資訊之裝置的一位置之位置估計器,其中該位置估計器係適用以基於由該提供方向資訊之裝置所提供的方向資訊而估計該空間位置估計裝置的位置。
[17] 一種空間位置估計之方法,該方法係包含:藉採用至少兩個音訊接收器之一陣列,接收附浮水印音訊信號,各個所接收的附浮水印音訊信號係包含一嵌入式浮水印,處理由在不同空間位置的至少二音訊接收器所記錄的至少二所接收的附浮水印音訊信號以決定針對各個所接收的附浮水印音訊信號之一接收器特定資訊,其中該接收器特定資訊係取決於嵌入在該等所接收的附浮水印音訊信號內之該等嵌入式浮水印,基於針對各個所接收的附浮水印音訊信號之該接收器特定資訊而提供方向資訊,及估計該至少兩個音訊接收器之陣列之一位置,其中該位置係基於該方向資訊決定。
[18] 一種電腦程式,當該電腦程式係由一電腦或處理器執行時其係用以執行如申請專利範圍第17項之方法。
类似技术:
公开号 | 公开日 | 专利标题
TWI480858B|2015-04-11|用以提供方向資訊之裝置及方法、用於空間位置估計之裝置及方法、和電腦程式
JP6086923B2|2017-03-01|幾何学配置に基づく空間オーディオ符号化ストリームを統合する装置および方法
KR101619578B1|2016-05-18|기하학 기반의 공간 오디오 코딩을 위한 장치 및 방법
US10284947B2|2019-05-07|Apparatus and method for microphone positioning based on a spatial power density
US9769565B2|2017-09-19|Method for processing data for the estimation of mixing parameters of audio signals, mixing method, devices, and associated computers programs
JP5665885B2|2015-02-04|二次元ビット拡散を用いたウォーターマーク生成器、ウォーターマーク復号器、バイナリーメッセージデータに基づいてウォーターマーク信号を提供する方法、ウォーターマーク済み信号に基づいてバイナリーメッセージデータを提供する方法及びコンピュータプログラム
JP5567150B2|2014-08-06|差分符号化を用いたウォーターマーク生成器、ウォーターマーク復号器、バイナリーメッセージデータに基づいてウォーターマーク信号を提供する方法、ウォーターマーク済み信号に基づいてバイナリーメッセージデータを提供する方法及びコンピュータプログラム
JP2013536477A|2013-09-19|到来方向推定値から曖昧性を解消する装置及び方法
CN108270492B|2020-11-06|一种伪装声通信的调制与解调方法
RU2575535C2|2016-02-20|Оценка направления прихода сигнала с использованием аудиосигналов с водяными знаками и массива микрофонов
Moutinho et al.2016|Indoor global localisation in anchor-based systems using audio signals
Choi et al.2015|Reverberation-robust acoustic indoor localization
同族专利:
公开号 | 公开日
CA2846080A1|2013-03-07|
HK1198718A1|2015-05-29|
KR101719194B1|2017-04-04|
TWI480858B|2015-04-11|
WO2013030339A1|2013-03-07|
AU2012300806B2|2015-04-23|
ES2558167T3|2016-02-02|
US11176952B2|2021-11-16|
MX2014002428A|2014-05-27|
AR087763A1|2014-04-16|
BR112014004778A2|2017-06-13|
EP2751587B1|2015-10-21|
RU2014111824A|2015-10-10|
CA2846080C|2020-03-10|
CN103917886B|2016-03-09|
KR20140056368A|2014-05-09|
EP2751587A1|2014-07-09|
JP5941545B2|2016-06-29|
JP2014527649A|2014-10-16|
AU2012300806A1|2014-04-10|
CN103917886A|2014-07-09|
US20140172435A1|2014-06-19|
EP2565667A1|2013-03-06|
引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题
AT433998T|1997-03-05|2009-07-15|Us Health|Divalent anti-t-zellen immuntoxinen und deren verwendung|
GB9720054D0|1997-09-19|1997-11-19|Celltech Therapeutics Ltd|Biological products|
AUPO930697A0|1997-09-19|1997-10-09|Walter And Eliza Hall Institute Of Medical Research, The|Catalytic antibodies and a method of producing same|
EP1103026A1|1998-06-01|2001-05-30|Datamark Technologies PTE Ltd|Methods for embedding image, audio and video watermarks in digital data|
JP4026933B2|1998-06-24|2007-12-26|キヤノン株式会社|情報処理装置及び方法並びに記録媒体|
KR100341197B1|1998-09-29|2002-06-20|포만 제프리 엘|오디오 데이터로 부가 정보를 매립하는 방법 및 시스템|
WO2000057399A1|1999-03-19|2000-09-28|Sony Corporation|Procede d'inclusion d'information additionnelle et dispositif a cet effet, et procede de decodage d'information additionnelle et dispositif a cet effet|
US6508709B1|1999-06-18|2003-01-21|Jayant S. Karmarkar|Virtual distributed multimedia gaming method and system based on actual regulated casino games|
US7020285B1|1999-07-13|2006-03-28|Microsoft Corporation|Stealthy audio watermarking|
US7770016B2|1999-07-29|2010-08-03|Intertrust Technologies Corporation|Systems and methods for watermarking software and other media|
US8301453B2|2000-12-21|2012-10-30|Digimarc Corporation|Watermark synchronization signals conveying payload data|
US6737957B1|2000-02-16|2004-05-18|Verance Corporation|Remote control signaling using audio watermarks|
US6892175B1|2000-11-02|2005-05-10|International Business Machines Corporation|Spread spectrum signaling for speech watermarking|
US7072487B2|2001-01-26|2006-07-04|Digimarc Corporation|Watermark detection using adaptive color projections|
JP3576993B2|2001-04-24|2004-10-13|株式会社東芝|電子透かし埋め込み方法及び装置|
US7606388B2|2002-05-14|2009-10-20|International Business Machines Corporation|Contents border detection apparatus, monitoring method, and contents location detection method and program and storage medium therefor|
US7131007B1|2001-06-04|2006-10-31|At & T Corp.|System and method of retrieving a watermark within a signal|
US7317811B2|2001-11-28|2008-01-08|Sony Electronics Inc.|Method to decode temporal watermarks in compressed video|
US7433489B2|2001-11-28|2008-10-07|Sony Electronics Inc.|Method to ensure temporal synchronization and reduce complexity in the detection of temporal watermarks|
JP2005528649A|2002-06-03|2005-09-22|コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ|マルチメディア信号中の電子透かしの再埋め込み|
US6865273B2|2002-06-05|2005-03-08|Sony Corporation|Method and apparatus to detect watermark that are resistant to resizing, rotation and translation|
AT341043T|2002-07-22|2006-10-15|Koninkl Philips Electronics Nv|Wasserzeichenerkennung|
US7480393B2|2003-11-19|2009-01-20|Digimarc Corporation|Optimized digital watermarking functions for streaming data|
EP1542226A1|2003-12-11|2005-06-15|Deutsche Thomson-Brandt Gmbh|Method and apparatus for transmitting watermark data bits using a spread spectrum, and for regaining watermark data bits embedded in a spread spectrum|
GB0403331D0|2004-02-14|2004-03-17|Koninkl Philips Electronics Nv|Watermark detection|
GB0403327D0|2004-02-14|2004-03-17|Koninkl Philips Electronics Nv|Watermark detection|
GB0403330D0|2004-02-14|2004-03-17|Koninkl Philips Electronics Nv|Watermark detection|
DE102004021404B4|2004-04-30|2007-05-10|Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.|Wasserzeicheneinbettung|
KR101236259B1|2004-11-30|2013-02-22|에이저 시스템즈 엘엘시|오디오 채널들을 인코딩하는 방법 및 장치|
TWI273845B|2004-12-09|2007-02-11|Nat Univ Chung Cheng|Voice watermarking system|
JP4519678B2|2005-02-21|2010-08-04|株式会社東芝|電子透かし検出方法及び装置、電子透かし埋め込み方法及び装置|
US20060239501A1|2005-04-26|2006-10-26|Verance Corporation|Security enhancements of digital watermarks for multi-media content|
WO2007015452A1|2005-08-04|2007-02-08|Nippon Telegraph And Telephone Corporation|電子透かし埋め込み方法、電子透かし埋め込み装置、電子透かし検出方法、電子透かし検出装置、及びプログラム|
JP2008064568A|2006-09-06|2008-03-21|Osaka Univ|音取得位置特定方法、音取得位置特定システム、特定装置及びコンピュータプログラム|
US7626889B2|2007-04-06|2009-12-01|Microsoft Corporation|Sensor array post-filter for tracking spatial distributions of signals and noise|
US8116514B2|2007-04-17|2012-02-14|Alex Radzishevsky|Water mark embedding and extraction|
TWI335522B|2007-06-12|2011-01-01|Univ Nat Changhua Education|Method for embedding watermark|
GB2452021B|2007-07-19|2012-03-14|Vodafone Plc|identifying callers in telecommunication networks|
US8725520B2|2007-09-07|2014-05-13|Qualcomm Incorporated|Power efficient batch-frame audio decoding apparatus, system and method|
JP2009080309A|2007-09-26|2009-04-16|Toshiba Corp|音声認識装置、音声認識方法、音声認識プログラム、及び音声認識プログラムを記録した記録媒体|
US8108681B2|2007-12-03|2012-01-31|International Business Machines Corporation|Selecting bit positions for storing a digital watermark|
US8099285B2|2007-12-13|2012-01-17|Dts, Inc.|Temporally accurate watermarking system and method of operation|
WO2009077930A1|2007-12-17|2009-06-25|Koninklijke Philips Electronics N.V.|Resolution-independent watermark detection|
US8498839B2|2007-12-28|2013-07-30|Nec Corporation|Position determination system, transmission device and reception device, and position determination method|
EP2149878A3|2008-07-29|2014-06-11|LG Electronics Inc.|A method and an apparatus for processing an audio signal|
US9117268B2|2008-12-17|2015-08-25|Digimarc Corporation|Out of phase digital watermarking in two chrominance directions|
JP5332602B2|2008-12-26|2013-11-06|ヤマハ株式会社|サービス提供装置|
JP5157931B2|2009-01-20|2013-03-06|大日本印刷株式会社|音響信号に対する情報の埋め込み装置および音響信号を利用した位置検出装置|
US8351589B2|2009-06-16|2013-01-08|Microsoft Corporation|Spatial audio for audio conferencing|
US9151821B2|2009-07-24|2015-10-06|Qualcomm Incorporated|Watermarking antenna beams for position determination|
WO2011052992A2|2009-10-29|2011-05-05|엘지전자 주식회사|컨텐트에 워터마크를 삽입하고 삽입된 워터마크를 검출하는 방법 및 장치|
JP5493850B2|2009-12-28|2014-05-14|富士通株式会社|信号処理装置、マイクロホン・アレイ装置、信号処理方法、および信号処理プログラム|
EP2362383A1|2010-02-26|2011-08-31|Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V.|Watermark decoder and method for providing binary message data|
EP2362385A1|2010-02-26|2011-08-31|Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V.|Watermark signal provision and watermark embedding|
EP2362387A1|2010-02-26|2011-08-31|Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V.|Watermark generator, watermark decoder, method for providing a watermark signal in dependence on binary message data, method for providing binary message data in dependence on a watermarked signal and computer program using a differential encoding|
EP2362386A1|2010-02-26|2011-08-31|Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V.|Watermark generator, watermark decoder, method for providing a watermark signal in dependence on binary message data, method for providing binary message data in dependence on a watermarked signal and computer program using a two-dimensional bit spreading|
EP2362384A1|2010-02-26|2011-08-31|Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V.|Watermark generator, watermark decoder, method for providing a watermark signal, method for providing binary message data in dependence on a watermarked signal and a computer program using improved synchronization concept|
CN107608447B|2010-09-03|2020-10-23|数字标记公司|用于估计信号间的变换的信号处理器及方法|
US9270807B2|2011-02-23|2016-02-23|Digimarc Corporation|Audio localization using audio signal encoding and recognition|
US8660581B2|2011-02-23|2014-02-25|Digimarc Corporation|Mobile device indoor navigation|
WO2013035537A1|2011-09-08|2013-03-14|国立大学法人北陸先端科学技術大学院大学|電子透かし検出装置及び電子透かし検出方法、並びに電子透かしを用いた改ざん検出装置及び改ざん検出方法|
US9305559B2|2012-10-15|2016-04-05|Digimarc Corporation|Audio watermark encoding with reversing polarity and pairwise embedding|
US9384754B2|2013-03-12|2016-07-05|Comcast Cable Communications, Llc|Removal of audio noise|
US9679053B2|2013-05-20|2017-06-13|The Nielsen Company , Llc|Detecting media watermarks in magnetic field data|US9955277B1|2012-09-26|2018-04-24|Foundation For Research And Technology-HellasInstitute Of Computer Science |Spatial sound characterization apparatuses, methods and systems|
US10175335B1|2012-09-26|2019-01-08|Foundation For Research And Technology-Hellas |Direction of arrivalestimation apparatuses, methods, and systems|
US10136239B1|2012-09-26|2018-11-20|Foundation For Research And Technology—Hellas |Capturing and reproducing spatial sound apparatuses, methods, and systems|
US9554203B1|2012-09-26|2017-01-24|Foundation for Research and Technolgy—HellasInstitute of Computer Science |Sound source characterization apparatuses, methods and systems|
US9549253B2|2012-09-26|2017-01-17|Foundation for Research and Technology—HellasInstitute of Computer Science |Sound source localization and isolation apparatuses, methods and systems|
US10149048B1|2012-09-26|2018-12-04|Foundation for Research and Technology—HellasInstitute of Computer Science |Direction of arrival estimation and sound source enhancement in the presence of a reflective surface apparatuses, methods, and systems|
CN103308889B|2013-05-13|2014-07-02|辽宁工业大学|复杂环境下被动声源二维doa估计方法|
US9679053B2|2013-05-20|2017-06-13|The Nielsen Company , Llc|Detecting media watermarks in magnetic field data|
EP2899997A1|2014-01-22|2015-07-29|Thomson Licensing|Sound system calibration|
EP2930923A1|2014-04-07|2015-10-14|Thomson Licensing|A method and a device for reacting to watermarks in digital content|
US10410643B2|2014-07-15|2019-09-10|The Nielson Company , Llc|Audio watermarking for people monitoring|
US20160210957A1|2015-01-16|2016-07-21|Foundation For Research And Technology - Hellas |Foreground Signal Suppression Apparatuses, Methods, and Systems|
EP3073488A1|2015-03-24|2016-09-28|Thomson Licensing|Method and apparatus for embedding and regaining watermarks in an ambisonics representation of a sound field|
US20160294484A1|2015-03-31|2016-10-06|Qualcomm Technologies International, Ltd.|Embedding codes in an audio signal|
US10602265B2|2015-05-04|2020-03-24|Rensselaer Polytechnic Institute|Coprime microphone array system|
US10425835B2|2015-12-04|2019-09-24|Industrial Technology Research Institute|Post network entry connection method in millimeter wave communication system and related apparatuses using the same|
US10394518B2|2016-03-10|2019-08-27|Mediatek Inc.|Audio synchronization method and associated electronic device|
US10419511B1|2016-10-04|2019-09-17|Zoom Video Communications, Inc.|Unique watermark generation and detection during a conference|
GB2563670A|2017-06-23|2018-12-26|Nokia Technologies Oy|Sound source distance estimation|
CN108702558B|2018-03-22|2020-04-17|歌尔股份有限公司|用于估计到达方向的方法和装置及电子设备|
WO2019227353A1|2018-05-30|2019-12-05|Goertek Inc.|Method and device for estimating a direction of arrival|
US10708612B1|2018-12-21|2020-07-07|The Nielsen Company , Llc|Apparatus and methods for watermarking using starting phase modulation|
US10652654B1|2019-04-04|2020-05-12|Microsoft Technology Licensing, Llc|Dynamic device speaker tuning for echo control|
NL2024416B1|2019-12-10|2021-08-31|Foccaert Y Bvba|Location determination system, method for determining a location and device for determining its location|
法律状态:
优先权:
申请号 | 申请日 | 专利标题
EP11179591A|EP2565667A1|2011-08-31|2011-08-31|Direction of arrival estimation using watermarked audio signals and microphone arrays|
[返回顶部]